Tối ưu hóa lồi: Định nghĩa bài toán tối ưu hóa lồi dạng chuẩn

Một bài toán tối ưu hóa lồi ở dạng chuẩn là nền tảng của lập trình toán học hiện đại. Nó được xác định bởi một hàm mục tiêu lồi $f_0$, các ràng buộc bất đẳng thức lồi $f_i$, và tuyến tính_affine ràng buộc đẳng thức. Bằng cách xác định bài toán trên giao của các miền này $\mathcal{D} = \bigcap_{i=0}^m \text{dom } f_i$, ta đảm bảo rằng mọi cực tiểu cục bộ đều là cực tiểu toàn cục.

1. Cấu trúc toán học của dạng chuẩn

Bài toán được nêu chính thức như sau:

$$\begin{aligned} &\text{tối thiểu hóa} && f_0(x) \\ &\text{ch subject to} && f_i(x) \leq 0, \quad i = 1, \dots, m \\ &&& a_i^T x = b_i, \quad i = 1, \dots, p \end{aligned}$$

Tập khả thi được định nghĩa là $\text{dom } F = \{x \in \text{dom } f_0 \mid f_i(x) \le 0, i = 1, \dots, m, h_i(x) = 0, i = 1, \dots, p \}$. Một yêu cầu quan trọng cho tính lồi là các ràng buộc đẳng thức phải tuyến tính_affine ($Ax = b$), vì các đẳng thức phi tuyến thường tạo ra các tập hợp không lồi.

2. Diễn giải hình học dạng epigraph

Dạng epigraph cho phép chúng ta diễn giải tối ưu hóa một cách hình học trong 'không gian đồ thị' $(x, t)$. Bằng cách giới thiệu biến dư $t$, ta tối thiểu hóa $t$ với điều kiện $(x, t) \in \text{epi } f_0$. Điều này chứng minh rằng tập khả thi, mọi tập con mức (sublevel set), và tập cực trị đều có bản chất lồi.

3. Sai lầm khi nhầm lẫn giữa ràng buộc ngầm và rõ ràng

Một hiểu lầm phổ biến là chuyển các ràng buộc vào hàm mục tiêu (làm chúng trở thành ngầm) sẽ đơn giản hóa bài toán. Tuy nhiên, việc làm cho các ràng buộc trở nên ngầm không hề làm cho bài toán dễ phân tích hay giải hơn, dù bài toán kết quả về mặt danh nghĩa là không có ràng buộc. Điều này đặc biệt đúng trong mô hình Oracle (hộp đen), nơi chúng ta đánh giá $f(x)$ và đạo hàm của nó với chi phí mà không biết cấu trúc rõ ràng.

4. Ứng dụng thực tế

Lý thuyết danh mục đầu tư: Tối thiểu hóa rủi ro $\text{var}(c^T x) = x^T \Sigma x$ cho 4 tài sản (ví dụ: Tài sản 1 với lợi suất 12%/độ lệch chuẩn 20%).
Kỹ thuật: Các ràng buộc cấu trúc như $y_i = 6(i - 1/3) \frac{F}{E w_i h_i^3} + v_{i+1} + y_{i+1}$.
Xác suất: Các ràng buộc rủi ro tổn thất $\Phi^{-1}(\beta) \leq 0$.

🎯 Nguyên lý cốt lõi

Điều kiện tối ưu cho một hàm $f_0$ khả vi là $\nabla f_0(x)^T(y - x) \geq 0$ với mọi $y$ khả thi. Điều này ngụ ý rằng gradient phải là một siêu phẳng hỗ trợ đối với tập khả thi tại điểm tối ưu.

CÂU HỎI 1

Tại sao các ràng buộc đẳng thức trong bài toán tối ưu hóa lồi phải là tuyến tính_affine ($Ax = b$)?

Vì các ràng buộc đẳng thức phi tuyến thường xác định các tập hợp không lồi.

Để đảm bảo hàm mục tiêu vẫn khả vi.

Vì mô hình Oracle không thể xử lý các hàm con phi tuyến.

Để cho phép sử dụng các biến dư trong việc chuyển đổi bất đẳng thức.

CÂU HỎI 2

Trong mô hình Oracle (hộp đen), điều nào sau đây là đúng?

Việc đánh giá hàm mục tiêu có chi phí tính toán bằng không.

Cấu trúc rõ ràng của hàm là chưa biết, nhưng chúng ta có thể đánh giá $f(x)$ và đạo hàm của nó.

Các ràng buộc ngầm làm cho bài toán dễ giải hơn nhiều so với các ràng buộc rõ ràng.

Ma trận Hankel phải là ma trận chéo để mô hình hội tụ.

CÂU HỎI 3

Epigraph của một hàm lồi $f_0$ biểu diễn điều gì trong ngữ cảnh tối ưu hóa?

Tập hợp tất cả các điểm mà gradient bằng 0.

Tập hợp các điểm nằm trên hoặc phía trên đồ thị của hàm.

Giao của tất cả các ràng buộc đẳng thức tuyến tính_affine.

Một tổ hợp tuyến tính của các đa thức với hệ số thực.

CÂU HỎI 4

Điều kiện toán học nào biểu diễn ràng buộc phổ trên ma trận $A$ bị chặn bởi $s$?

$\|A\|_2 \leq s \iff A^T A \preceq s^2 I$

$Ax = b$

$\text{var}(c^T x) = x^T \Sigma x$

$\Phi^{-1}(\beta) \leq 0$

CÂU HỎI 5

Kết quả của việc đưa biến dư vào ràng buộc bất đẳng thức $f_i(x) \le 0$ là gì?

Bài toán trở thành không có ràng buộc.

Nó thay thế bất đẳng thức bằng một ràng buộc đẳng thức và một ràng buộc không âm.

Nó biến đổi một bài toán lồi thành một bài toán dấu không lồi.

Tập khả thi được chiếu lên ma trận Hankel.